資料整形 (active読書)
以下の作業のこと
図表
の切り出し
scrapbox書籍
にしたページに貼り付けた画像から、図表だけを切り出す
元のPDFがある場合は、
PDFに埋め込まれた画像を抽出する
して取り出す
文章をテキストデータ、図表を画像データに分ける
文章の整形
段落ごとに空行を挿入する
↓の作業で段落の改行が区別できなくなるので、事前に分けておく
最終的な編集で段落分けがよくわからなくなることもある
改行を直す
一旦改行を消して句点で改行し直すPopupMenu
などで、
OCRしたテキストを整形
する
空行で区切った塊ごとにやる
数式を
$ \TeX
に書き起こす
基本手書き
takker.icon
Mathpix Snip
を使える人はそっちのほうがいいと思う
OCRした数式をLLMで補正
する方法もある
精度はまあまあ
#active読書
#2023-12-15
07:58:20
#2022-11-17
05:57:36
#2022-09-28
09:04:49
#2022-09-27
10:33:57